Aprendizaje Estadístico Supervisado

Natalia da Silva

2024

Sobre nosotros

  • Responsable:Natalia da Silva

  • Ayudante: Bruno Tancredi

Sobre nosotros

Natalia da Silva

Prof. adjunto en el Instituto de Estadística (IESTA-UDELAR)

Formación

  • Lic. en Estadística y Lic. Economía: UDELAR

  • Doctorado y Maestría en Estadística: Iowa State University, USA

Investigación

  • Natalia: Aprendizaje estadístico, estadística computacional, visualización estadística, reproducibilidad y ciencia de datos.

Sobre nosotros

Bruno Tancredi

Ayudante del Instituto de Estadística (IESTA-UDELAR)

Formación

Licenciado en Estadística 2024!

Investigación

Ciencia de datos, computación estadística y aprendizaje estadístico

Temas del Curso

  1. Introducción a las técnicas de aprendizaje automático. Principios básicos.
  2. Modelo lineales y Modelos lineales generalizados
  3. Regresión polinómica, constante a trozos y escalonadas. Modelos aditivos generalizados.
  4. Técnicas de Remuestreo.
  5. Regularización
  6. Árboles de regresión y clasifcación.
  7. Métodos de agregación de modelos: bagging, boosting y random forest y extensiones.
  8. Tema seleccionado según preferencia de los estudiantess.

Evaluación

  • Actividades de laboratorio individual (15%)
  • Tareas domiciliarias individuales (35%).
  • Participación en clase (10%).
  • Trabajo final grupal (40%).

Aprueba la UC y exonera el examen si suma al menos 65% del total de puntos en las evaluaciones antes enumeradas

Aprueba el curso y gana el derecho a dar examen parcial si el puntaje total está entre 50 y 64 puntos.

EVA

  • EVA, presentaciones del curso y foros de discusión

  • Clave de matriculación AES_2024

Material obligatorio

  • An Introduction to Statistical Learning: link libro

  • También pusimos como libro obligatorio Elements of Statistical learning: link libro pero lo usaremos para algunos puntos específicos.

  • Artículos seleccionados algunos incluídos en las referencias

Algunos término populares

  • Big Data: datos complejos por Volumen, Variedad o Velocidad

  • Aprendizaje estadístico : métodos y algoritmos para detectar patrones predecir nuevos datos.

  • Ciencia de Datos: Enfocado en transformar datos en información relevante para la toma de decisiones. Involucra, limpiado, validación, transformación, visualización, modelado, relacionado con exploración de datos

Hay muchos más: Aprendizaje automático, Business analytics, Reconocimiento de patrones, Minería de datos, Aprendizaje profundo, Inteligencia Artificial…

Denominador común

¿Cuál es el denominador común en todos esos términos?

Métodos estadísticos es una ciencia transversal que se encarga de recolectar información, analizar y entender los datos y modelar la incertidumbre de los mismos.

Métodos computacionales todo el ciclo de vida de los datos sucede a través de métodos computacionales, desde el registro y almacenamiento, su análisis, y su comunicación.

Evolución Estadística

El centro de la disciplina se ha movido desde lo más matemático y lógico a lo más computacional.

  • 1900: Pearson: test \(\chi^2\)
  • 1908: Fisher: estadístico t-Student
  • 1933: Pearson: test de hipótesis óptimo
  • 1962: Tukey: el futuro del análisis estadístico
  • 1963: Morgan y Sonquist: primer algoritmo de árboles
  • 1979: Efron: Bootstrap
  • 2001: Brieman: Random forest
  • 2016: Ciencia de datos

Evolución Estadística

  • Inferencia Clásica: MCO, MV, Bayes, Familia Exponencial

  • Primeros métodos computacionales: Bayes empírico, Ridge, glm, bootstrap, árboles, MCMC

  • Tópicos siglo 21 FDR, Lasso, Random Forest, Redes Neuronales, SVM, Model Selection